【疯狂7月】⑤—免费在线小工具:双表合并 | 云平台
The following article is from HellsegaMosken Author HellsegaMosken
“联川书籍”火热销售中,《单细胞测序研究一本通2.0》新鲜出炉,
详情请戳:小伙伴们!《单细胞测序研究一本通2.0》新书发售~
扫描上方二维码,看更多书籍↑
悄咪咪告诉你,参与下方活动即可获得哦
疯狂7月,您点单,我开发还有礼品拿。
前言
之前介绍过生信操作中常用的两种表格操作工具:
提取表格中的ID信息:不会用VLOOKUP批量提取表格信息?鼠标操作轻量小工具助力科研!);
生信绘图必备的ID合并工具:(免费在线小工具:表格ID信息去重)
今天我们介绍另一个表格处理小工具,可以配合使用哦。
云工具
https://www.omicstudio.cn/tool/80
应用场景
生信分析中经常需要合并两张表,本工具可以根据两表中包含相同信息的列来合并两表。
常见的应用场景:
1.基因注释 - 如一张表是基因表达量,一张表是数据库下载的基因信息,合并就相当于是基因注释;
2.关联分析 - 如一张表是转录数据,一张表是蛋白数据,当二表都有基因列时可以用此云工具。
格式说明
两张表必须有一列内容是对应的(列名可以不同), 会根据此列中相同的内容将两表合并起来。
示例数据
如下图所示,是两张示例数据,左表是基因差异分析结果,右表是基因的KEGG注释信息。两表有一列共同信息(红框所示),均为基因的Ensembl数据库的基因ID。我们的目的是合并两表,相当于是对差异分析做KEGG数据库注释,这样我们可以在一张表中查看差异表达和对应的通路信息。
选择对应列
如下图,分别选择表1和表2的对应列。此工具会依据此列将两表进行合并。
如果选择的信息不合适,会进行提醒:
选择合并方式
依据您的分析需求来进行合并即
以左表为准:保留左表所有值
我们看下合并效果:左表(下左)的总行数是60612,合并后(下右)有81503行,那么多出来的行是哪里来的呢?
首先,结果中包含了原左表的所有值。同时,右表中的对应列有重复的基因,因为一个基因可能不止一个通路注释,由此导致同一个基因占了多行。需要注意的是,如果左右表的值都有重复,那么合并结果会更多,如:左表中gene1出现了2次,右表中gene1出现了3次,那么合并后gene1会出现2*3=6次(即进行排列组合)。
以右表为准:保留右表所有值
我们看下合并效果:右表(下左)的总行数是28666,合并后(下右)有28666行,那么为什么这次的结果行数和右表的行数是一样的呢?
首先,结果中包含了原右表的所有值。同时,左表中的对应列没有重复的基因,所以合并过程中行不会增加。另外,因为我们选了以右表为准,即使一个基因在右表中有而左表中没有,这一行也不会删除,所以合并后的总行数最少和右表的行数是一致的。
取两表并集:保留两表所有值
我们看下合并效果:左表(上左)的总行数是60612,右表(上右)的总行数是628666,合并后(下)有81503行。合并后的文件总行数超过了两表的总行数,有两种原因:1.重复基因;2.两表的基因并不完全重合,有些基因有表达量无注释,有些基因有注释但是没有测到。
取两表交集:保留两表共有值
我们看下合并效果:左表(上左)的总行数是60612,右表(上右)的总行数是628666,合并后(下)有28666行。在此案例中,取交集的意义是,保留既有差异分析结果,也有基因注释的基因。
结果下载
最后点击按钮就可以下载啦
拓展说明
本文以做基因注释为例,在实际应用过程中,此工具的应用场景非常广泛,只要您的两表有一列是同类信息就可以合并。
还有什么想开发的云工具,可填写此调查问卷,选中并上线的话有机会免费获得联川生物书籍一本哦:https://www.wenjuan.com/s/UZBZJvPSgg/?is=qrcode
联川书籍:https://weidian.com/?userid=1659112072&wfr=c&ifr=itemdetail&source=shop&sfr=app
联川生物云平台主页:https://www.omicstudio.cn/index
云平台精选资料汇总:https://mp.weixin.qq.com/s/rP_m-O8FTmG6DXr4rbE74w
【疯狂7月】①—免费在线小工具:fasta序列提取 | 云平台
【疯狂7月】③—免费在线小工具:表格ID信息去重 | 云平台
点击下方图片进入云平台资料汇总:
所见即所得,figure有bi格
联川云平台,让科研更自由